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(g) Personenldentifikation mit Bewegungsinformation 

@ Das technische Geblet der Erflndung Ist die Personenlden- 
tifikation. £s wird vorgeschlagen, die Bewegungsinformation 
aus Btdsequenzen auszuwerten, die sich ergeben, wenn ein 
typischer oder vorgegebener Bewegungsablauf (2; 2a, 2b, 
2c, 2d, 2e) der zu identifizierenden Person ausgefuhrt wird. 
Der erwahnte Bewegungsablauf wird aufgezeichnet und 
mittels eines synergetischen Computers ausgewertet, um 
hohe Sicherheit bei der Erkennung zu erhalten. Ton- und 
statische Bildinformation kdnnen begleitend ausgewertet 
werden. 
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Beschreibung 

Das technische Gebiet der Erfindung ist die Persone- 
nidentifikation mittels Auswertung von Informationen, 
die der Person an sich anhaften und ohne Verwendung 
von Hilfsmitteln, wie Ausweise, Schlussel oder Geheim- 
zahlen. 

Das sichere Erkennen — und damit das Identifizieren 

— von Personen ist nach wie vor technisch ungeldst 
Derzeitige Ans&tze gehen davon aus, daB sich Personen 
Qber Hilfsmittel identifizieren Beispiele dafClr sind der 
oft gefalschte Ausweis, die verlorengegangenen SchlQs- 
sel oder die allzu haufig vergessene Geheimzahl). Auch 
Passworter haben im heutigen Leben nur eine kurze 
Lebensdauer, da sie entweder zu einfach gestaltet sind 
oder von unberechtigten Personen leicht in Erfahrung 
gebracht werden kdnnen. Gerade die zuletzt genannte 
Gefahr tritt haufig dann auf, wenn man eiiig eine Zu- 
gangsberechtigung bendtigt und das eingegebene (ver- 
meintlich richtige) Passwort nicht funktioniert 

Sicher Identifizierung von Personen heiBt aber auch: 
Schiitzen eines lokalen Bereiches gegen unberechtigten 
Zutritt. Beispiele hier sind militarische Anlagen oder 
gefahrdete Bereiche in Kernkraftwerken. Auch der Zu- 
tritt zu Informationen, wie Akten oder Geheimdienstin- 
formationen, die in unserem Zeitalter zunehmend Be- 
deutung erlangen, fordert eine genau abgestimmte Zu- 
gangsberechtigung fur Personen. abhangig von ihrer 
Zuverl&ssigkeit und ihrem Kompetenzbereich. 

Der Stand der Technik kennt die Analyse statischer 
Biider, so der Gesichtserkennung, der Erkennung von 
HandabdrOcken oder die Analyse von FingerabdrQcken. 
Aufgrund der starken Varianz im Aussehen der Person 
als auch der Schwierigkeit, reproduzierbare Aufnahme- 
bedingungen zu schaffen, zeigen diese Systeme eine 
"Ungenauigkeit", die noch so hoch ist, daB von einer 
"sicheren Personenerkennung" nicht gesprochen wer- 
den kann. Sicher kann eine Personenerkennung nur 
dann werden, wenn sie mit (nahezu) lOOyoiger Sicher- 
heit arbeitet. 

Scheinbar mit einer Bildsequenz befaBt sich die £P 82 
304 Bl; die Bildsequenz, die dort Anwendung findet, ist 
aber nicht mehr als eine Vorstufe, urn das geeignete 
Momentanbild (Einzelbild) zu lokalisieren und in einem 
Qblichen statistischen Vergleichsverfahren mit vorab 
gespeicherter Information zu vergleichen, Um das dort 
als "Schlusselereignis" bezeichnete Momentanbild wah- 
rend des Sprechens eines Schlusselwortes aufzufinden, 
werden akustisch gewonnene Energiesignale ausgewer- 
tet und bei Oberschreiten eines Schwellenwertes das 
relevante Einzelbild aus der fortwahrend aufgezeichne- 
ten Sequenz ausgesondert, festgehalten und ausgewer- 
tet Zur Auswertung dient die Verzerrung eines auf den 
Lippenbereich projizierten Linien- oder Gittermusters 
zum Zeitpunkt des Schlusselereignisses. Also liegt dort 
eine — mit akustischer Signalauswertung kombinierte 

— Einzelbildauswertung vor. 

Die Erfindung schl^gt zur Erreichung einer sicheren 
Personenidentifizierung dagegen die technische Lehre 
des Anspruches 1 vor. Sie wird ergSnzt und konkreti- 
slert mit den Lehren der abh^ngigen Anspfuche 2 bis 7. 
Unabhangig davon schUgt die Erfindung zur Implemen- 
tierung der vorgenannten Verfahren einen synergeti- 
schen Computer vor (Anspruch 10). Das Lernverfahren 
zur Erstellung von kontrasterhdhenden Adjungierten 
des Audio- und des optischen Merkmalsvektors ist Ge- 
genstand des Anspruchs 8. Der Audio- Merkmalsvektor 
kann Ober eine FFT aus dem Spektrogramm; der opti- 
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sche Merkmalsvektor kann ebenf alls Qber eine FFT aus 
dem optischen FluB berechnet werden (Anspruch 9). 

Anstelle des statischen Elides des Standes der Tech- 
nik verwendet die Erfmdung Bildsequenzen (Bildfol* 
gen). Diese Biidfolgen definieren die Bewegungsinfor- 
mationen, die uber die Berechnung eines optischen Flus- 
ses (vgL Fig. 6 oder Fig. 7) ausgewertet wird Um die 
Auswertung sicher zu gestalten, wird ein typischer oder 
ein vorgegebener Bewegungsablauf verwendet, dessen 
Bildsequenzen ausgewertet und mit Vergleichswerten 
verglichen werden. Vor einem Vergleich kann eine Da- 
lenreduktion mittels eines Klassifizierungs*Verfahrens 
erfolgen (Anspruch 7). mit der eine Filterung groBer 
Datenmengen mdglich ist 

Die Erfindung. wie sie in ihrem Anspruch 1 mit ihren 
maBgeblichen Merkmalen umrissen ist, wertet die Se- 
quenz von Bildem aus, in der das Einzelbild "untergeht**. 

Ein typischer Bewegungsablauf kann eine Gang- oder 
ICopfbewegung sein (Anspruch 3); ein vorgegebener 
Bewegungsablauf kann die Bewegung eines Gesichtes 
Oder eines Teilbereiches eines Gesichtes (GesichtszOge) 
sein, die beim Sprechen eines vorgegebenen Wortes 
oder Satzes entsteht (Anspruch 2). Die typischen und 
vorgegebenen Bewegungsabl^ufe kOnnen vorteilhaft 
kombiniert werden (Anspruch 4), Die Auswertung der 
Kombination kann parallel oder ineinander verschach- 
telt verlaufen. Zusatzlich zur Bildsequenz-Information 
kann die Auswertung von statischer Bild-lnformation 
eingesetzt werden (Anspruch 5). 

Die Bildsequenz-Information und die Auswertung 
von statischer Bild-lnformation kann mit der Auswer- 
tung akustischer Information erg^nzt werden (An- 
spruch 6X um die ZuverllLssigkeit (weiter) zu erhdhen. 

Ein synergetischer Computer zur ReaUsierung des Er- 
kennungsverfahrens im vorgenannten Sinn ist Gegen- 
stand des Anspruches 10; er ist z. B. in einem Tagungs- 
band der Tagung in Innsbruck (April 1993, Seiten 206 bis 
212) naher erl^utert; alierdings nicht fur den Zweck des 
Anspruchs 10. Der Titel dieser Druckschrift ist 'Using a 
Synergetic Computer in an Industrial Classification Pro- 
blem"; Gegenstand der Tagung und Name des Tagungs- 
bandes ist "Artificial Neural Networks and Genetic Al- 
gorithms". Insbesondere unter der dortigen Ziffer 2 wird 
die hinter einem solchen synergetischen Computer ste- 
hende Theorie erlSutert, bei der einer der speziellen 
Algorithmen auf die L6sung einer Matrixinversion zu- 
rQckgefQhrt werden kann, anstelle der Integration eines 
Systems von Differentialgleichungen. Vorgeschlagen 
wird auch, neurale Netzwerke zu verwenden. Das dorti- 
ge Anwendungsgebiet war die Erkennung von Kfz-Fel- 
gen, die einem GieB- oder SpritzguB-Verfahren ent- 
stammen. Dabei verbleiben Reste von Aluminium (oder 
anderem Metall) an den Felgen, die eine genaue Erfas- 
sung erschweren. Hinzu kommt, daB die Position der zu 
erfassenden Felgen ebenso wie die Orientierung vielfal- 
tig und dem System nicht bekannt ist. 

Auf einer anderen Konferenz lECON 1992 in San 
Diego, California, vom 9. bis zum 13. November 1992 ist 
in einem Vortrag von Yamasaki und Takahashi ein 
adaptives Tonerfassungs-System vorgeschlagen wor- 
den, bei dem visuelle Effekte ergSlnzend herangezogen 
wurden, um auch in der (technischen) Erkennungstech- 
nik den (humaneigenen) "Cocktail party- Effekt" zu reali- 
sieren. Dieser Effekt auBert sich dadurch, daB ein 
Mensch in der Lage ist, mit seinen Sinnen trotz eines 
erheblichen Hintergrundger&usches und eines sehr 
schlechten S/R-Verhaitnisses (S/N-Ratio) bestimmte 
ihn interessierende Information herauszufiltern. Diese 
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— menschliche-Eigcnschafi"-ist-heutc-weder-genau~ er- 
forscht noch kann sie in der hohen Qualit&t technisch 
reproduziert werden. Ziel des vorgenannten Vortrages 
war es also, ein Tonsi^al von einer Quelle (einem ge- 
sprochenen Satz von einer Person) aus einer Vielzahl 
von unterschiedlichen Umgebungsgeriuschen heraus- 
zufiltern und dabei das Signal/Rausch-Verh^ltnis zu 
verbessem. Als Anwendungsgebiet nennt der Vortrag 
die Erfassung von fehlerhaften Maschinenkomponenten 
(durch Erkennen "seltsamer" Gerausche)^oder die Erfas- 
sung'von menschlichen StimnSe'n in-ianhehder-Omge- 
bung (als Mensch/Maschine-lnterface, bei dem cine 
Person der Maschine auf akustischem Wege mitteiit, 
welche weiteren Schritte sie einsetzen soil). Die im Vor- 
trag erwahnte Technik verwendet neben akustischen 
Informationen optische informationen und verbindet 
diese beiden Informationsquellen, so daB eine "Sensor- 
Fusion" entsteht. Die Verbindung der beiden Informa- 
tionen erfolgt in zwei Ebenen, einem Ton-Untersystem 
und eine Visual-Untersystem. 

Anders als die vorgenannten AnsStze verwendet die 
Erfindung maBgeblich eine Bildsequenz und den opti- 
schen FIuB zur Erreichung einer sicheren (hochgenau- 
en) Person enidentifikati on. Erst zusatzlich konnen aku- 
stische Informationen herangezogen werden oder stati- 
sche Bilder ausgewertet werden. 

Das Verst^ndnis der Erfindung soli an einem Ausfiih- 
rungsbeispiel vertieft werden. 

Fig. I zeigt ein Beispiel der visuellen und akustischen 
Erfassung von Informationen, die von einer schematisch 
dargestellten Person 2 ausgehen. 

Fig. 2 veranschaulicht einen vorgegebenen Bewe- 
gungsablauf anhand von (schematisch in Folge darge- 
stellten) Gesichtsziigen 2a bis 2e aber der (senkrecht 
verlaufenden) Zeitachse t. Die Gesichtsziige werden 
von einer Hochgeschwindigkeitskamera 10 aufgezeich- 
net. 

Fig. 3 ist eine Darstellung des optlschen Auswertep- 
fades, mit dem die Bildsequenzen verarbeitet werden, 
namentlich tiber ein FluBvektor-Feld und ein solches 
mit reduzierter Aufldsung hin zu einem hochdimensio- 
nalen Merkmalsvektor, der in ein Klassifikationsverfah- 
ren eingespeist wird. Das Kiassifikationsverfahren kann 
in einem synergetischen Computer programmiert sein. 

Fig. 4 ist ein mit Fig. 3 korrespondierender akusti- 
scher Auswertepfad, in dem die akustischen Signale di- 
gitalisiert und als Spektrogramm dargestellt werden. 
Der Weg fOhrt auch hier iiber einen eindimensionalen 
Merkmalsvektor, der in ein Kiassifikationsverfahren 
eingespeist wird, das in einem synergetischen Computer 
programmiert sein kann. 

Fig. 5 zeigt die Kombination der beiden Auswerte- 
verfahren, wobei die optische und akustische Vorverar- 
beitung als Blockschaltbild jeweils diejenigen Auswer- 
teschritte der Fig. 3 bzw. 4 beinhalten, die vor dem ein- 
dimensionalen Merkmalsvektor liegen. Die Ausgangssi- 
gnale der optischen Klassifikation und der akustischen 
Klassifikation werden in einer Verknupfung 20 zusam- 
mengefaCt und ergeben das Auswertesignal E, das bei 
Verwendung zur Personen-Identifikation die Aussage 
ist, ob die das Kennwort sprechende Person eine der 
vorgespeichenen Personen ist 

Die Fig. 6 veranschaulicht anhand einer Lippenfoige 
beim Sprechen einer Person den Bewegungsablauf. der 
zum optischen FIuB von der Schaltung gemaB Fig. 3 
umgesetzt wird. Die weiBen Richtungspfeile sind cha- 
rakterisiisch fCir die Bewegung bestimmter Bereiche der 
Lippengegend. 



— Fig. 7 a. 7b und 7c veranschaulichen einen beispielhaf- 
ten anderen Bewegungsablauf, hier zwei Bilder einer 
aufgezeichneten Bildsequenz und das sich daraus erge- 
bende FluBvektor-Feld in Fig. 7c. Deutlich ist die Bewe- 
5 gung des Balles mit Richtung und Rotation erkennbar, 
ebenso wie die Bewegung des Armes des Kindes, ob- 
wohl in den beiden nebeneinandergestellien Moment- 
anbildem gemtB Fig. 7a und 7b nahezu kein Unter- 
schied erkennbar ist Deutlich — geradezu Qberdeutlich 
10 — wird der Bewegungsablauf also mit dem FluBvektor- 
feld gemaB Fig. 7c, das mit der Schaltung gemiB Fig. 3 
berechnet werden kann. 

In der Fig. 1 ist eine Person schematisch mit 2 darge- 
stellt Ein vorgegebener Bewegungsablauf der Gesichts- 
15 zuge der (schematisch dargestellten) Person 2 ist in 
Fig. 2 mit 2a bis 2e veranschaulicht. 

Das System zur Erkennung der Person 2 verwendet in 
diesem Beispiel eine Hochgeschwindigkeits-Kamera 10, 
die auf die Person 2 gerichtet ist, so wie ein Mikrofon 12. 
20 das Sprachsignale aufzeichnen kann. Die optischen Si- 
gnale der Kamera 10 und die Tonsignale des Mikrofons 
12 werden einer Ansteuerelektronik II zugefiihrt Diese 
Ansteuerelektronik 1 1 kann die Signale so aufbereiten, 
dafi sie einem Rechner 1 zur Auswertung zugefuhrt 
25 werden kdnnen. Dabei ist es sowohl mdglich, der An- 
steuerelektronik bereits Analog/E!)igitalwandler bei zu- 
geben als auch diese Analog/Digitalwandler in der Aus- 
werteeinheit 1 selbst anzuordnen, so daB die Kopplun- 
gen zwischen den Bildinformations-Quellen 10 und 12 
30 auf analoger Basis vorgenommen werden. 

De r V erfahrensablauf im Beispiel der Fig. 1 und 2 
beginnt mit der Vorgabe eines Wortes, Satzes oder 
Kennwortes, z, B. dem Namen der zu erkennenden Per- 
son. Die Hochgeschwindigkeits-Kamera 10 und das Mi- 
35 krofon 12 nehmen die dabei entscehenden Signale 
gleichzeitig auf und leiten sie der Ansteuerelektronik 1 1 
zu. Beim Sprechen des Wortes oder Satzes werden die 
Bewegungen des Gesichts oder eines Teilbereiches da- 
von aufgezeichnet Ein Kiassifikationsverfahren ist in 
40 der Auswerte-Einheit programmiert, um zu groBe Da- 
tenmengen auf ein auswertbares MaB zu reduzieren. 
Zuvor Oder danach wird der optische FluB der Gesichts- 
mimik errechnet und anhand von Vergleichswerten mit 
hoher Sicherheit eine der "gespeicherten Personen" wie- 
45 dererkannt Wird keine Obereinstimmung zwischen den 
vorgespeicherten Daten und der den Zugang oder Zu- 
tritt anfordemden Person erkannt, so besteht die Mog- 
lichkeit der Wiederholung der vorgenannten Vorge- 
hensweise. Bei hoheren Sicherheitsstufen kann es auch 
50 ratsam sein, diese Wiederholung nicht vorzunehmen 
und die Berechtigung sogleich abzulehnen, 

Detaillierter ergibt sich die Auswertung in der Aus- 
werteeinheit 1 dadurch, daB der optische FluB aus der 
Bildsequenz der Hochgeschwindigkeitskamera 10 be* 
55 rechnet wird, der die Bewegungsinformation in kompri- 
mierter Form — jedoch nicht beliebig genau — wieder- 
gibt Die Bewegungsinformation setzt sich dabei aus 
einer Mehrzahl von Abtastwerten der Gesichtsziige zu- 
sammen, so daB fiktive Punkte des Gesichts eine be- 
60 stimmte Bewegung oder Bewegungskurve beschreiben, 
die mit dem optischen FluB (vgl. Horn und Schunk, "De- 
termining Optical Flow". Artificial Intelligence. Vol. 17. 
1981, Seiten 185 bis 203) festgelegt werden. Die akusti- 
schen Daten werden mit einer K.urzzeit-Fourier-Trans- 
65 formation (FFT) ausgewertet, um die vorhandene Fre- 
quenzinformation adaquat darzustellen. 

Das in der Auswerteeinheit 1 programmierte Verfah- 
ren und die Ansteuerelektronik 1 1 der Fig. I und 2 fin- 
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den sich in den Fig. 3. 4 und 5 wieder. EingangsgroQe in 
Fig. 3 ist das optische Signal tiber die Kamera 10, Aus- 
gangsgrdBe ist eine erkannte Person oder ein Erken- 
nungssignal Eb. EingangsgrdOe in Fig. 4 ist ein akusti- 
sches Signal Qber das Mikrofon 12, AusgangsgroBe ist 
das Erkennungssignal Ea. Beide AusgangsgrdCen k6n- 
nen in einer Verknupfung 20 kombiniert werden und 
bilden das Ausgangssignal E, das fOr eine erkannte Per- 
son stehen kann. Die Verknupfung 20 kann als einfaches 
UND-Gatter ausgestaltet sein. 

^ Das in_Fig. 3 dargestellte optische Verarbeitungssy- 
stem verarbeitet eine echte Bildsequenz und diese Bild- 
sequenz reprasentiert sich in dem eindimensionalen 
Merkmalsvektor. der dem Klassifikationsverfahren zu- 
geleitet wird. Die aufeinanderfolgenden Bilder der Ka- 
mera 10 werden in eine digitale Bildsequenz umgesetzt, 
aus ihnen wird ein FluBvektor-Feld (FluBsequenz) er- 
rechnei, die anhand der Fig. 6 und 7 noch erlautert wird; 
die FluBsequenz ist ein Bild von Vektorpfeilen. Diese 
entstandene FluBsequenz wird umgesetzt in eine solche 
mit reduzierter Aufldsung (Mittelung), um die Daten- 
menjg^e zu beschranken. 

Die FluBsequenz mit reduzierter Aufldsung kann 
nochmals fouriertransformiert werden, wenn eine Lage- 
Invarianz des Bildes oder der Person erwQnscht ist. 

Das Ergebnis ist der eindimensionale Merkmalsvek- 
tor. der der Kiassifikation zugefQhrt wird und aus dem 
das Erkennungssignal Eb abgeteitet ist 

In vergleichbarer Weise arbeitet die akustische Aus- 
wertung gemSB Fig. 4. Das digitalisierte Akustiksignal 
bildet ein Spektrogramm, bei dem die hohen Amplitu- 
-den hell dargestellt sind-und die-geringen-Ampliiuden 
dunkel erscheinen. Jede Linie ist repr^sentativ fQr eine 
AbtastzeiL 

Auch hier kann eine Koordinaten-Transformation er- 
folgen, fur akustische Signale bietet sich eine logarithmi- 
sche Transformation an. Mittels dieser Transformation 
erreichi man eine TonhOhen-Invarianz, die vergleichbar 
ist mit der Lagelnvarianz bei der optischen Auswertung 
gemaBFig. 3. 

Der eindimensionale Merkmalsvektor. der fUr die 
akustischen Signale gemaB Fig. 4 gebildet wird, wird 
der Klassifikation Qberreicht, die daraus das Ausgangs- 
signal Ea bildet. 

Die Klassifikations- Verfahren der Fig. 3 und 4 kdn- 
nen auf einem synergetischen Computer programmiert 
sein. 

Die Kombination der Verfahren gemaB Fig. 3 und 4 
ist in Fig. 5 dargestellu Jede Datenquelle (akustisch, op- 
tisch) extrahiert auf dem beschriebenen Weg geeignete 
Merkmale, die die akustische Information bzw. die Bild- 
sequenz- Information bestmdglich reprasentieren. Diese 
Merkale werden In den eindimensionalen Zahlenvekto- 
ren festgehalten und der Klassifikation zur Bildung der 
Ausgangssignale Eb oder Ea iibergeben. 

Bevor auf die Auswertung in der Klassifikation und 
den dort auch programmierten Lernalgorithmus einge- 
gangen wird, soil der optische FluB anhand der Fig. 6 
und 7a, 7b bzw. 7c erlautert werden. 

Der optische FIuB in Fig. 6 ist z. B. derjenige eines 
Lippenbereiches. Fiktive Punkte haben die weiB darge- 
stellten Bewegungen, die hinsichtlich Lange und Rich- 
tung ausgewertet werden k6nnen. Bei der Bewegung 
sind im wesentlichen nur Vektoren des entstehenden 
FluBvektor-Feldes zu erkennen, die in vertikaler Rich- 
tung verlaufen. Anders ist der Sachverhalt bei einer Ro- 
tationsbewegung, beispielsweise des Balles gemaB 
Fig. 7a. 7b. Dort ist in dem FluBvekior-Feld der Fig. 7 
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erkennbar,.daB der Ball rotiert.-Oie-FluBvektoren sind 
also in der Lage, jede Bewegung^ von fiktiven Punkten 
auszuwerten und selbst bei statischen, kaum erkennba- 
ren Unterschieden, deutliche Vektoren aufzuzeigen, die 
den Bewegungsablauf festlegen und markant beschrei- 
ben kdnnen. 

Ebenfails erkennbar ist die Bewegung des Armes des 
Kindes und des Knies des Kindes, das in den Fig. 7a und 
7b dargestellt ist. Der Kopf ist nahezu unbeweglich. 

In den Fig. 3, 4 und 5 ist ein Lernalgorithmus angege- 
ben. Er dient der Festlegung der' bestimmten/dem Sy- 
stem bekannten Personen. Bei einem solchen Lernver- 
fahren auf einem synergetischen Computer wird entwe- 
der fQr den optischen oder fQr den akustischen Informa- 
tionspfad die Vielzahl der Merkmale, die fur jede Klasse 
berechnet worden ist, zu adjungierten Prototypen um- 
gerechnet FQr jede Klasse — jede Klasse entspricht 
einer Person — existiert ein adjungierter Prototyp. Die- 
se Adjungierte hat die Eigenschaf t, diejenigen Merkma- 
20 le in der Bewertung stark zu berlicksichtigen, die signifi- 
kante Unterschiede zwischen einzelnen IGassen (einzel- 
nen Personen) aufzeigen, wahrend andere Merkmale. 
die in alien Klassen nahezu gleich sind. stark unter- 
drQckt werden. Sie ist "kontrastbildend". 

Mittels des Lemverfahrens werden die adjungierten 
Prototypen berechnet. diese adjungierten F^ototypen 
erm6glichen die zielstrebige Klassinkation von noch un- 
bekannten optischen oder akustischen Merkmalsvekto- 
ren. 

Ist das Lernverfahren einmal ausgefOhrt und besteht 
ein Datensatz an Klassen, so kdnnen zu erkennende 
Personen (ein zu klassinzierender Merkmalsvektor oder 
ein zu klassifizierendes Muster) leicht erkannt werden. 
Der Merkmalsvektor wird gemilB den Schaltungen von 
35 Fig. 3 und Fig. 4 bzw. Fig. 5 erstellt und dann der Klassi- 
fikation Qbergeben, die auf die gelemten Klassen zu- 
ruckgreifen kann. 

Die bereits gelernten adjungierten Prototypen, die 
die Eigenheiten jeder einzelnen Klasse (jeder einzelnen 
40 Person) zum Ausdruck bringen, werden im Klassifika- 
tionsmodus dann dem noch unbekannten Merkmalsvek- 
tor zugeordnet und als "schon dagewesen" erkannt oder 
als unbekannt zurOckgewiesen. 

Eine vorteilhafte Erganzung dieser Sequenz- und 
45 Akustik-Auswertungen bildet die Auswertung von Ein- 
zelbildem der aufgezeichneten Bildsequenz. Als geeig- 
nete Einzelbilder haben sich das Anfangs- und Endbild 
eines kurzen Zeitabschnittes erwiesen, in dem die dyna- 
mische Erkennung erfolgt; sie kOnnen zusatzlich als In- 
50 formationsquelle fur die Festlegung der zu identifizie- 
renden Person herangezogen werden. 

Werden alle drei Datenquellen kombiniert, so kCnnen 
diese drei Sensor-Eingangssignale in ein Klassif ikations- 
Verfahren eingegeben werden, das wie zuvor erlautert 
arbeitet 

Die vorerw^hnte Verfahrensweise zur Erkennung 
von Personen hat in einem Versuchsaufbau ergeben, 
daB unabhdngig von der Umgebungsbedingung (Hin- 
tergrund, Skalierung, UchteinfluB) zuverlsissige Idemifi- 
kationsraten erhalten werden. 

Besonders vorteilhaft ist an dem beschriebenen Ver- 
fahren, daB die zu identifizierende Person keine Hilfs- 
mittel, wie Schiussel oder Ausweise verwenden muB. 
Auch sind keine Markierungen oder Kennzeichnungen 
an der jeweiligen Person erforderlich. Die der Identifi- 
kation zugrundeliegenden BewegungsablHufe, das Spre- 
chen von vorgegebenen Worten oder das Ausfuhren 
typischer BewegungsablSufe, kann hftufig gewechselt 
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~Wixie rrso~*daBneihe *nicht"zugangsberechtigte Person 
sich auf die jeweilige Erkennungsprobe nicht vorberei- 
teten oder einstellen kann. 

Patentanspruche 5 

1. Verfahren zur Personcnidentifikation, bei dem 
Bewegungsinformation aus Bildsequenzen (Fig. 2 
Oder Fig. 6), die aufgrund eines — typischen oder 
vorgegebenen ~ Bewegungsablaufs an bzw. von 10 
der Person entstehen. aufgezeichnel (tOX ausge- 
wenet und mit Vergleichswerten verglichen wer- 
den. 

2. Verfahren nach Anspruch 1, bei dem der vorge- 
gebene Bewegungsablauf die Bewegung der Ge- 15 
sichtszQge der zu erkennenden Person beim Spre- 
chen eines vorgegebenen Wortes oder Satzes ist. 

3. Verfahren nach Anspruch 1, bei dem der typische 
Bewegungsablauf eine Gang- oder Kopfbewegung 
der zu identifizierenden Person isL .20 

4. Verfahren nach Anspruch 2 und 3, bei dem ein 
typischer Bewegungsablauf mit einem vorgegebe- 
nen Bewegungsablauf kombiniert erfaBt wird. ' 

5. Verfahren nach einem der erwahnten Anspruche, 
bei dem die Auswertung des Bewegungsablaufs (ty- 25 
pisch und/oder vorgegeben) mit der Auswertung 
von statischen Bildem kombiniert wird, 

6. Verfahren nach einem der erwahnten AnsprUche, 
bei dem die Auswertung der Bildsequenzen und/ 
oder der statischen Bilder mit der Auswertung von 30 
Audioinformation kombiniert (20) wird. 

7. Verfahren nach einem der erwahnten Anspruche, 
bei-dem-ein-Klassifikations-Verfahren-vorgesehen 

ist. daB insbesondere ein Vergleich des unbekann- 
ten Merkmalsvektors mit adjungierten Protoiypen 35 
ist, die aufgrund eines Lernverfahrens erhalten 
wurden. 

8. Lernverfahren fUr ein Personen-Identifikations- 
verfahren, bei dem 

(a) zu einem — aus der optischen Bildsequenz 40 
(10) und dem aus dem optischen FluBvektor- 
Feld ermittelten — Merkmalsvektor eine Ad- 
jungierte errechnet wird, die als Klasse dem 
Kiassifikations-Verfahren zur Verfagung 
steht; oder/und 45 

(b) aus dem akustischen Signal (12) ein Spek- 
trogramm gebildet wird, das in einen Merk- 
malsvektor umgesetzt und zu einer Adjungier- 
ten umgerechnet wird. 

9. Lernverfahren nach Anspruch 8, bei dem die 50 
Merkmalsvektor-Bildung Ober eine zwischenge- 
schaltete Fourier-Transformation erfolgt 

10. Verwendung eines synergetischen Computers 
for eine Person enidentifizierung gem&B einem der 
vorhergehenden AnsprOche. 55 
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